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REMARKS 

These comments are responsive to the Office Action dated April 29, 2009, which rejected 
pending claims 44-50 under 35 U.S.C. § 103(a) as being unpatentable over Conley 
(US2002/0099904) in view of Chien et al. (US patent number 6,742,078) and Brinkmann et aL 
(US2006/0242212), It is respectfully submitted that these rejections are in error and should be 
withdrawn. Although relieved allowable in its previous form, independent claim 44 has been 
amended to improve its clarity. Also, claim 51 has been added. Consequently, the present 
response is being filed along with a Request for Continued Examination (RCE). 

The Office Action is relying upon patent publication document US2006/0242212 of 
Brinkmann et ah as one of its secondary references. The publication date on this document is 
October 26, 2006, The filing date of the present application is December 30, 2003. Brinkmann 
claims priority from a PCT application PCT/EP/2003/008635, which was published as 
International Publication Number WO 2004/021214 Al, a copy of which is attached. As can be 
seen from a review of this PCT document, and as is noted on its cover at "(26) 
Veroffentlichungssprache [Publication language]: Deutsch", this PCT application is published in 
German. Consequently, this document does not qualify as prior art against the present 
application under the provisions of 35 U.S.C. 102(e). For a discussion, see the M.P.B.P. at 
section 706. 02(f)(l)I, (C)(1)(c), for example. Therefore, the Office Action's rejection of claims 
44-50 under 35 U.S.C. § 103(a) based upon US2006/0242212 of Brinkmann et al as one of its 
references is not well-founded and should be withdrawn on this basis alone. 

Further, even if Brinkmann were applicable as prior art against the present application, as 
discussed in the previous response, the Office Action's use of this reference is respectfully 
submitted to be in error. The Office Action cited Brinkmann at paragraphs [0079] and [0084]- 
[0088]; but, as noted in the previous Response, the "deviations" of Brinkmans's paragraph 
[0079] are not the "deviations for the rule", as found in the claims, but "deviations from the 
desired distribution", which is something quite different. Similarly, the "links" of Brinkmann are 
quite different in meaning and in their relationship to "deviations" from these words as found in 
claim 44 

Therefore, for at least these reasons, it is respectfully submitted that a rejection of claim 
44 under 35 U.S.C. § 103(a) as being unpatentable over Conley (US2002/0099904) in view of 
Chien et al (US patent number 6,742,078) and Brinkmann et ah (US2006/0242212) is not well 
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founded and should be withdrawn. Claims 45-51 are all dependent claims and, consequently, 
allowable as well, with a number of these including further limitation that make them further 
allowable, although these will not be discussed further at this time. 

Consequently, it is now believed that the present application is now in form for 
allowance, an early indication of which is earnestly solicited. 
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sowie fehlerbehafteten Systemen. Hierfur wird vorgeschlagen, 



(57) Abstract: The invention relates to a method 
and an arrangement for randomly storing data in 
storage networks and/or an intranet and/or the internet, 
a corresponding computer program product, and a 
corresponding computer-readable storage medium, 
which are particularly suitable for distributing and 
retrieving data in error- tolerant and faulty systems such 
as storage networks or the internet. According to the 
inventive method for randomly storing data in storage 
networks and/or an intranet and/or the internet, one or 
several intervals, the total length of which corresponds 
to the relative capacity of the system, is/are assigned 
to each storage system. Said intervals are represented 
in a [0,1) interval but can overlap with other intervals 
as opposed to existing strategies. A real point is then 
assigned to each data block within the [0,1) interval 
by means of a (pseudo)random function. Optionally, 
said point can be part of several intervals of storage 
systems. A uniform placement strategy is used in order 
to assign the data block to one of said storage systems 
if that is the case. The interval lengths are adjusted 
correspondingly if the relative capacities of the storage 
systems change. 

(57) Zusammenfassung: Die vorliegende Erfindung 
beschreibt ein Verfahren und eine Anordnung zur ran- 
domisierten Datenspeicherung in Speichernetzwerken 
und/oder einem Intranet und/oder dem Internet sowie 
ein entsprechendes Computerprogramm-Erzeugnis und 
ein entsprechendes computerlesbares Speichermedium, 
welche insbesondere einsetzbar sind fiir die Verteilung 
und das Wiederauffinden von Daten in fehlertoleranten 
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dass bei dem Verfahren zur randomisierten Datenspeicherung in Speichernetzwerken und/oder einem Intranet und/oder dem Internet 
jedem Speichersystem ein oder mehrere Intervalle zugeordnet werden. Diese Intervalle werden auf ein [0,1) -Interval 1 abgebildet, 
konnen sich aber im Gegensatz zu friiheren Strategien mit anderen Intervallen iiberlappen. Jedem Datenblock wird nun mittels 
einer (pseudo- )zufalligen Funktion ein reeller Punkt im [0,1)-Intervall zugewiesen. Dieser Punkt kann zu mehreren Intervallen 
von Speichersystemen gehoren. Falls dem so ist, wird eine uniforme Platzierungsstrategie verwendet, um den Datenblock einem 
dieser Speichersysteme zuzuweisen. Verandern sich die relativen Kapazitaten der Speichersysteme, so werden die Intervalllangen 
angepasst. 
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Verfahren und Anordnung zur randomisierten 
Datenspeicherung 

10 



15 

B e s chre ibung 



2 0 Die vorliegende Erfindung betrifft ein Verfahren und 
eine Anordnung zur randomisierten Datenspeicherung in 
Speichernetzwerken und/oder einem Intranet und/oder dem 
Internet sowie ein entsprechendes Computerprogramm- 
Erzeugnis und ein entsprechendes computerlesbares 

25 Speichermedium, welche insbesondere einsetzbar sind fur 
die Verteilung und das Wiederauf f inden von Daten in 
f ehlertoleranten sowie f ehlerbehaf teten Systemen, wie 
beispielsweise Speichernetzwerke, einem Intranet oder 
dem Internet . 

30 

Die Organisation von mehreren Datenspeichersystemen als 
effizientes und flexibles Speichersystem erfordert die 
Losung zahlreicher Aufgaben. Eine der wichtigsten ist 
es, eine geeignete Datenplatzierung, d. h. eine geeig- 
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nete Strategie zur Verteilung der Datenblocke uber das 
Speicher system zu finden, die einen schnellen Zugriff 
auf die Daten und eine hohe Sicherheit gegen Daten- 
verlust erlaubt. Im Rahmen der Beschreibung wird im 
5 Folgenden zwischen einer Menge von auf die Datenblocke 
zugreifenden Einheiten, den Clients, und einer Menge 
von Einheiten, die Datenblocke ausliefert, den Servern, 
unterschieden. Die Begriffe Server und Datenspeicher- 
system we r den dabei synonym verwendet . 

10 

Die im Folgenden betrachteten Verfahren und Systeme 
dienen zum Aufbau von verteilten Datenservern und 
Spe i cherne t z wer ken , sowie zum Aufbau von Web-Systemen 
zum Caching von Daten. Ein verteilter Datenserver, bzw. 

15 ein Speichernet zwerk , besteht im Allgemeinen aus einer 
Menge von Computersystemen, die uber ein Net zwerk mit 
einer Menge von Datenspeichersystemen, verbunden sind. 
Das Verbindungsnet zwerk zwischen den Computersystemen 
und den Datenspeichersystemen besteht aus einer Menge 

2 0 von Switches bzw. Routern, die eine Zustellung der 
Datenpakete zwischen kommunizierenden Einheiten 
sicherstellen (siehe Figur 1) . Weiterhin kann das 
System iiber eine Menge von SAN-Appliances (SAN 
Storage Area Network) verfiigen, die an das Netzwerk 

2 5 angekoppelt sein konnen und ein Koordination zwischen 

den einzelnen Computersystemen und den 

Datenspeichersystemen sicherstellen (siehe Figur 2) . 
Weiterhin konnen so genannte In-Band-Appliances 
zwischen die Computer systeme und die Daten- 

3 0 speichersysteme geschaltet werden (siehe Figur 3). In- 

Band-Appliances finden bei der so genannten In-Band- 
Virtual is ierung Verwendung. Bei der In-Band- 
Virtualisierung befindet sich die Kontrollinstanz , die 
In-Band- Appliance, im Datenstrom zwischen Server und 
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Speicher. Die Steuerdaten wie auch die Nutzdaten laufen 
durch die Appliance, die den Servern als das 
Speicher system selbst erscheint. Die Zuordnung von 
Speicher segment en, auch als logische Volumes 
5 bezeichnet , zu jedem einzelnen Server geschieht hier. 
Ebenso passiert die Steuerung des Datenzugrif f s uber 
diese Appliance. Demgegenuber gibt es auch den Ansatz , 
die Virtualisierung liber die so genannte Out-of-Band- 
Virtualisierung zu realisieren. In diesem Falle 

10 befindet sich die Appliance auSerhalb des Datenpfades 
und kommuniziert liber das Netzwerk (beispielsweise ein 
LAN) mit dem Host-Bus-Adapter (HBA) im Server, der 
einen speziellen Agenten benotigt. Die Appliance 
definiert die logischen Volumes, die ein Server 

15 benutzen darf . Die exakten Inf ormationen uber die 
zugehorigen logischen und physischen Blocke speichert 
der Server anschliefiend auf seinem HBA. In-Band verftigt 
iiber den Vorteil, sich unkompliziert ins Speichernetz 
integrieren und warten zu lassen. Da In-Band im 

2 0 Datenpfad operiert, lasst sich die Datensicherheit 

durch eine Storage-Firewall in der SAN-Appliance mit 
geringem Auf wand erhohen . Out-Band gestaltet sich auf 
Grund der Wechselwirkungen zwischen den zusatzlichen 
Agenten auf den Applikat ions servern und der SAN- 
25 Appliance komplexer. Im Gegensatz zu In-Band belegt 
diese Methode im Switch nur wenige Ports, so dass vor 
allem bei groiSen redundant ausgelegten SANs eine hohere 
Skalierbarkeit zur Verfugung steht. Zudem behindert ein 
Ausfall der SAN-Appliance den Datenzugrif f nicht . Im 

3 0 Falle des Einsatzes von In-Band- Appliances werden alle 

Lese/ Schreib-Operationen der an die In-Band-Appliances 
angeschlossenen Computer syst erne erst von einer der In- 
Band-Appliances entgegengenommen , bevor sie an die 
Speichersysteme weitergeleitet werden. Die 
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Funktionalitat zum Management und zur Verteilung der 
Daten kann dabei sowohl in die Computersysteme, in die 
Router, als auch in die In-Band-Appliances integriert 
werden. Es wird im weiteren Verlauf davon ausgegangen, 
5 dass die an ein Speichernetzwerk bzw. einen verteilten 
Dateiserver angeschlossenen Computersysteme uber alle 
fur das Auffinden von Daten notwendigen Inf ormationen 
verfiigen. 

10 Ein Web-Cache ist eine Einheit in einem Netzwerk, die 
stellver tret end fur einen oder mehrere Web-Server 
Zugriffe von Web-Clients beantwortet . Um diese 
Funktionalitat zur Verfugung zu stellen, verfugt der 
Web-Cache uber ein Speichersystem, auf dem Teile der 

15 Inhalte der Web-Server gespeichert werden. Speichert 
der Web-Cache die von einem Client angefragten 
Information nicht, so wird die Anfrage an einen 
ubergeordneten Web-Cache, bzw. den ursprtinglichen Web- 
Server weitergeleitet und von diesem beantwortet. Web- 

2 0 Caches erfreuen sich aus verschiedenen Grunden einer 

weiten Verbreitung im Internet . Durch den Einsatz eines 
Web-Caches kann die Latenzzeit, die zwischen dem 
Stellen einer Anfrage von dem Web-Client bis zu der 
erf olgreichen Auslief erung der Inf ormationen an den 
25 Web-Client vergeht, signifikant reduziert werden. Die- 
ses trifft besonders dann zu, wenn die Bandbreite zwi- 
schen dem Web-Cache und dem Web-Client groBer als die 
Bandbreite zwischen dem Web-Server und dem Web-Client 
ist oder wenn die Belastung des Web-Servers so hoch 

3 0 ist, dass es bei der Auslief erung der Daten in dem Web- 

Server selbst zu Stauungen kommt . Weiterhin kann durch 
den Einsatz von Web-Caches der Datenverkehr im Internet 
reduziert werden, wodurch eine Steigerung der Lei- 
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stungsf ahigkeit des gesaraten Systems Internet erzielt 
werden kann. 

Durch die Kooperation mehrerer Web-Caches, die an ver- 
5 schiedenen Orten des Internets platziert werden, kann 
die Leistungsf ahigkeit des Internets deutlich erhoht 
werden. Beispielsweise fur die kooperative Zusammen- 
arbeit mehrerer Web-Caches sind das NLANR (National 
Laboratory of Applied Network Research) Caching-System, 
10 dass aus einer Menge von Backbone-Caches in den USA 
besteht, oder das Akamai Caching- System, das Caching- 
Services fur Unternehmen auf der ganzen Welt bereit- 
stellt . 

15 Der Hauptunterschied in der Bereitstellung von Ver- 
fahren zum Wiederauf f inden von Daten in Speichernetz- 
werken bzw. verteilten Dateiservern und fur Web-Caches 
besteht darin, dass im Falle von Speichernetzwerken die 
angeschlossenen Computersysteme uber alle Inf ormationen 

2 0 bezuglich der Platzierungsstrategie verfiigen, die zum 
Wiederauf f inden der von ihnen verwendeten Daten not- 
wendig sind. Dieses umfasst unter anderem die Anzahl 
und die Eigenschaf ten der angeschlossenen Server, 
respektive der Datenspeichersysteme . Im Falle von Web- 

2 5 Caches verfilgt der Client hingegen nur iiber eine 

beschrankte Sicht des Gesamtsys terns , d. h. er kennt 
nicht alle an das System angeschlossene Web-Caches. 
Werden nicht alle Daten auf alien Web-Caches ge- 
speichert, kann dieses dazu fiihren, dass der Web-Client 

3 0 ein Datum nicht von einem Web-Cache, sondern nur direkt 

vom Web-Server anfordern kann, da er entweder keinen 
Web-Cache kennt, der die von ihm angefragten Inf orma- 
tionen speichert, oder weil er zwar den fur ihn re- 
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levanten Web-Cache kennt, jedoch diesen Web-Cache nicht 
als fur dieses Datum zustandig identif izieren kann. 

Um eine hohe Effizient, Skalierbarkeit und Robustheit 
5 eines Datenspeichersys terns , bzw. eines Web-Caches 
sicherzustellen, sind eine Reihe von Anf orderungen zu 
erf til 1 en . Eine geeignete Datenverwaltungsstrategie 
sollte : 

10 1. jede anteilsmaSige Aufteilung der Datenblocke auf 
die Speichersysteme erflillen konnen. Flir identische 
Systeme wird in der Regel die gleichmafeige Ver- 
teilung der Datenblocke liber die Systeme gefordert. 
2. es ermoglichen, die Datenfragen gemaiS der anteils- 

15 maSigen Zuordnung der Datenblocke an die Daten- 

speichersys t erne verteilen zu konnen. Fiir den Fall 
unterschiedlicher Zugrif f shauf igkeiten auf Daten- 
blocke ist dieser Punkt nicht automatisch durch 
Punkt 1 sichergestellt . 

20 3. f ehlertolerant sein, d. h. Ausfalle von Datenspei- 
chersystemen ohne Datenverlust libers tehen konnen. 
Die verlorenen Teile sollten in moglichst kurzer 
Zeit neu generiert werden konnen. 
4. sicherstellen, dass bei einer Hinzufligung oder 

2 5 Wegnahme von Datenspeichersys temen nur moglichst 

wenige Datenblocke replatziert werden mlissen, um 
die oberen Punkte wieder herzustellen . Dieses 
sollte moglichst ohne splirbare Beeintrachtigung des 
laufenden Betriebs geschehen. 

3 0 5. eine kompakte Speicherung und effiziente Berechen- 

barkeit der Platzierung sicherstellen. 



Verfligt der Client nur liber unvollstandige Information 
nen liber die Verteilung der Daten liber die Datenspei- 
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cher syst erne , wie z. B. der Client von Web-Caches, so 
muss zusatzlich der folgende Punkt unterstiitzt werden: 

6. auch wenn der Client nur iiber unvollstandige, bzw. 
5 falsche inf ormationen uber den Aufbau des Speicher- 

systems verfugt, muss die Datenplatzierungsstrate- 
gie sicherstellen, dass eine hochst mogliche Anzahl 
von Zugriffen auf das Speichersystem erfolgreich 
ist, d. h. an einen die Inf ormationen speichernden 
10 Server gestellt werden. 

Es gibt im Wesentlichen zwei Standardstrategien fur die 
Speicherung von Daten in Fes tplattensys tern: 

15 1. die Verwendung einer Zeigerstruktur, die ahnlich 
der Verbindungsstruktur in Dateisystemen fur klas- 
sische Speichermedien (wie z. B. Festplatten und 
Disketten) arbeitet, oder 
2. die Verwendung eines virtuellen Adressraums, der 

2 0 ahnlich eines virtuellen Adressraums in Rechnern 

verwaltet wird. 

Wir werden uns im Folgenden auf den zweiten Punkt 
beschranken und annehmen, die Daten eines Festplatten- 
25 systems werden in Form eines virtuellen Adressraums 
gleichgroEer Datenblocke verwaltet. Das Problem besteht 
also darin, eine • geeignete Abbildung des virtuellen 
Adressraums auf die Festplatten zu finden. 

3 0 Die einfachste Art der Abbildung ist das so genannte 

Disk- Striping [CPK95] , das in vielen Ansatzen in 
unterschiedlicher Granularitat verwendet wird [PGK88, 
TPBG93, BBBM94, BHMM93 , HG92, BGMJ94, BGM95] . Diese 
Methode hat eine weite Verbreitung in 
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Festplattenf eldern (auch als RAID-Arrays [RAID = 
Redundant Array of Independent Disks] bezeichnet) 
erfahren, da viele der optionalen Platzierungsmethoden 
(genannt: RAID-Level) auf Disk-Striping aufbauen. Beim 
5 Disk-Striping werden die Datenblocke des virtuellen 
Adressraums (oder Teilblocke dieser Datenblocke) zyk- 
lisch um die Festplatten gewickelt. Diese Strategie hat 
den Nachteil, dass sie sehr unflexibel beztiglich einer 
sich andernden Anzahl an Festplatten ist. Eine Ver- 

10 anderung um lediglich eine Festplatte kann eine fast 
vollstandige Neuverteilung der Datenblocke erfordern. 
Aus diesem Grund sind heutige Festplattenf elder nur 
schlecht skalierbar. Ublicherweise werden daher Fest- 
plattensysteme mit sehr vielen Festplatten in mehrere 

15 RAID-Arrays untergliedert . 

Die Verwendung von zuf alligen Datenplatzierungen 
(mittels pseudo-zuf alliger Funktionen) ist bereits von 
vielen Forschern als vielversprechende Alternativ- 

20 methode angesehen wo r den [AT97, B97, SMB9 8 , K97]. In 
dieser Technik werden den Datenblocken zufallig aus- 
gewahlte Festplatten zugewiesen. Zu den ersten, die 
zufallige Datenplatzierungsstrategien untersucht haben, 
zahlen Mehlhorn und Vishkin [MV83]. Insbesondere haben 

25 sie untersucht, inwiefern mehrere zufallig platzierte 
Kopien pro Datenblock helfen konnen, um Anfragen 
gleichmaSig auf die Speichereinheiten zu verteilen. 
Weitere wichtige Resultate in dieser Richtung sind 
z. B. von Upfal and Wigderson [UW87] und Karp, Luby und 

3 0 Meyer auf der Heide [KLM92] erzielt worden. 



Birk [B97] hat ahnliche Datenabbildungs- und -zugriffs- 
strategien vorgeschlagen, aber er verwendet eine 
Paritatskodierung der Datenblocke. 
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Wei t ere Arbeiten sind unter anderem von Santos und 
Muntz im Rahmen des RIO Datenserver-Pro j ekts (RIO = 
Remote I/O) durchgef uhrt worden [SMB9 8, SM9 8] . Sie 
5 vergleichen die zufallige Platzierung mit traditionel- 
len Striping -Me thoden und zeigen, dass selbst in 
Situationen, fur die Disk-Striping entwickelt worden 
ist (regulare Zugriff smuster) , die zufallige Platzie- 
rung gleichwertig oder besser ist [SM98b] . Ihre zuf al- 
io lige Platzierung basiert auf einem zufalligen Muster 
fester GroSe. Falls die Anzaiil der Datenblocke diese 
GroEe ubersteigt, dann wenden sie das Muster wiederholt 
an, urn den gesamten Datenraum auf die Festplatten abzu- 
bilden. Das kann naturlich zu unangenehmen Korrelatio- 
15 nen zwischen den Datenblocken fuhren und eine Abwei- 
chung von der Gleichverteilung der Datenblocke und An- 
fragen verursachen. 

Bisher gibt es jedoch nur wenige Ansatze, die in der 
2 0 Lage sind, die Anf orderungen an eine effiziente, 
pseudo-randomisierte Datenplatzierung zu erfullen . 
Besonders Schwierigkeiten ergeben sich . dann, wenn 
heterogene, das heiSt verschieden groEe Datenspeicher- 
sy st erne verwendet werden oder wenn Datenspeichersysteme 

2 5 dynamisch in ein System eingefugt oder aus dem System 

herausgenommen werden . 

Ein erster Ansatz, urn Datenblocke dynamisch und ran- 
domisiert uber Datenspeichersysteme zu verteilen, ist 

3 0 in [KLL+97] vorgestellt worden. Dort werden (pseudo- 

) zuf allige Funktionen verwendet, urn den Datenblocken 
und Datenspeichersystemen zufallige reelle Punkte im 
Intervall [0,1] zuzuweisen. Ein Datenblock wird immer 
von dem Datenspeichersystem gespeichert, dessen Punkt 
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am nachsten am Punkt des Datenblocks im [0 , 1] -Interval 1 
liegt. Der Vorteil dieser Strategie liegt darin, dass 
sie einfach zu verwalten ist und sie nur die 
Replatzierung einer erwartungsgemaS minimal en Anzahl an 
5 Blocken bei einer wechselnden Anzahl an Datenspeicher- 
systemen erf ordert . Sie hat allerdings den Nachteil, 
dass relativ hohe Schwankungen um den Erwartungswert 
fur die Anzahl der auf einem Datenspeichersystem zu 
speichernden Blocke und der zu replatzierenden Blocke 
10 auftreten konnen und dass sie nur fur homogene Daten- 
speichersysteme effizient anwendbar ist. 

In [BBS99] wurde ein Verfahren vorgestellt, das auch 
auf (pseudo-) zuf alligen Funktionen aufbaut. Die Daten- 

15 blocke werden wie auch in [KLL+97] mittels einer sol- 
chen Funktion auf zufallige Punkte im [0 , 1] -Interval 1 
abgebildet. Aber die Zuordnung des [0,1] -Interval Is auf 
die Datenspeichersysteme geschieht mittels einer fest 
vorgegebenen Abb il dung, die Assimilierungs funktion ge- 

2 0 nannt wird. Diese Funktion sorgt dafur, dass jede Fest- 
platte den gleichen Anteil des [ 0 , 1 ] -Intervalls zuge- 
wiesen bekommt . Damit kann gewahrleistet werden, dass 
nicht nur die benutzten Datenblocke des virtuellen 
Adressraums sondern auch Anfragen an diese Blocke 

2 5 gleichmaJSig uber die Festplatten verteilt werden kon- 

nen. Ein Vorteil dieses Verfahrens im Vergleich zu 
[KLL+98] liegt darin, dass die Assimilierungs funktion 
die Daten mit wesentlich geringeren Abweichungen von 
der Gleichverteilung uber die Datenspeichersysteme ver- 

3 0 teilen kann. Wie die Strategie in [KLL+98] benotigt 

diese Strategie nur die Replatzierung einer erwartungs- 
gemaS minimalen Anzahl an Blocken bei einer wechselnden 
Anzahl an Datenspeichersystemen . Allerdings funktio- 



WO 2004/021214 



PCT/EP2003/008635 



11 

niert sie wie die Strategie in [KLL+98] nur gut fur 
homogene Systeme. 

Da es haufig aus Kostengrunden nicht effizient ist, 
5 dass ein Speicher system rein aus identischen Daten- 
speichersystemen besteht, wurden in [BSS00] auch 
Strategien fur nichtuni forme Datenspeichersysteme ent- 
worfen. Diese basieren auf der in [BBS99] vorgestellten 
Strategie fur identische Datenspeichersysteme. Zunachst 

10 wird angenommen, alle Systeme haben die gleiche 
Speicherkapazitat . Auf alle die Intervallteile, die 
iiber die Kapazitat einer Datenspeichersysteme hinaus- 
gehen, wird dann in einer zweiten Runde noch einmal die 
Strategie fur identische Festplatten angewandt, aller- 

15 dings diesmal nur auf die Datenspeichersysteme, die 
nach der ersten Platzierungsrunde noch freie Kapazita- 
ten besitzen. Die dabei nicht unterzubringenden Inter- 
vallteile werden in einer weiteren Runde noch einmal 
platziert, usw. , bis das komplette [ 0 , 1] -Intervall 

20 untergebracht ist. Der Hauptnachteil dieses Verfahrens 
besteht darin, dass es Situationen gibt, in denen 
deutlich mehr an Daten umplatziert werden, als minimal 
notwendig . 

25 Die Aufgabe, die durch die Erfindung gelost werden 
soli, besteht darin, ein Verfahren und eine Anordnung 
zur randomisierten Datenspeicherung in Speichernet zwer- 
ken und/ oder einem Intranet und/oder dem Internet sowie 
ein entsprechendes Computerprogramm-Erzeugnis und ein 

3 0 entsprechendes computerlesbares Speichermedium bereit- 
zustellen, durch welche die vorstehend genannten Nach- 
teile behoben werden und insbesondere eine effektive 
Behandlung von Speichernet zwerken, die heterogene 
Speichermedien umfassen, sowie eine dynamische 
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Skalierung von Speichernetzwerken durch Einfiigen oder 
Herausnehmen von Speichermedien gewahrleistet wird. 

Diese Aufgabe wird erfindungsgema.fi gelost durch die 
Merkmale im kennzeichnenden Teil der Anspriiche 1, 15, 
2 3 und 2 4 im Zusammenwirken mit den Merkmalen im Ober- 
begriff . Zweckma&ige Ausgestaltungen der Erfindung sind 
in den Unteranspriichen en thai ten. 

Ein besonderer Vorteil der Erfindung liegt darin, dass 
durch das Verfahren zur randomisierten Datenspeicherung 
in Speichernetzwerken und/oder einem Intranet und/oder 
dem Internet die Behandlung von Anderungen im Speicher- 
netzwerk ganz erheblich vereinfacht wird, indem eine 
Menge von Datenblocken Di (i = l, m) einer Menge von 

Datenspeichersystemen Sj (j = l/ . n) gemalS den 

folgenden Schritten zugeordnet und dort gespeichert 
wird: 

a) der Gesamtmenge der Datenspeichersysteme wird ein 
virtueller Speicherraum und j edem einzelnen Daten- 
speichersystem Sj (j=l, .--/ n) durch einen ersten 
Zuf allsprozefi mindestens ein Teilraum Ij des vir- 
tuellen Speicherraums zugeordnet, wobei das Ver- 
haltnis zwischen dem Teilraum Ij und dem gesamten 
virtuellen Speicherraum wenigstens naherungsweise 
dem Verhaltnis der auf das Datenspeichersystem Sj 
bzw. auf die Gesamtmenge der Datenspeichersysteme 
bezogenen Werte eines vorgebbaren Parameters 
entspricht , 

b) jedem Datenblock D± (i=l, m) wird durch einen 
zweiten Zuf allsprozeE ein (zufalliges) Element h(i) 
des virtuellen Speicherraums zugeordnet, 

c) fur jeden Datenblock D± (1=1/ - m) wird minde- 
stens ein Teilraum I k ermittelt, in dem h(i) ent- 
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halten ist, und der Datenblock Di mindestens einem 
der durch diese(n) Teilraume (Teilraum) I k repra- 
sentierten Datenspeichersystem S k zugeordnet und 
dort gespeichert . 

5 

Eine Anordnung zur randomisierten Datenspeicherung in 
Speichernetzwerken und/oder einem Intranet und/ o der dem 
Internet ist vorteilhaf terweise so eingerichtet, daJS 
sie mindestens einen Prozessor umfaSt, der (die) derart 

10 eingerichtet ist (sind) , dafe ein Verfahren zur 
randomisierten Datenspeicherung in Speichernetzwerken 
und/oder einem Intranet und/oder dem Internet durch- 
fuhrbar ist, wobei die randomisierte Datenspeicherung 
die Verf ahrensschritte gemaS einem der Anspriiche 1 bis 

15 14 umfaSt. 

Ein Computerprogrammprodukt zur randomisierten Daten- 
speicherung in Speichernetzwerken und/oder einem Intra- 
net und/oder dem Internet umfafit ein computer lesbares 

2 0 Speichermedium, auf dem ein Program gespeichert ist, 

das es einem Computer ermoglicht, nachdem es in den 
Speicher des Computers geladen worden ist, ein Ver- 
fahren zur randomisierten Datenspeicherung in Speicher- 
netzwerken und/oder einem Intranet und/oder dem Inter- 
25 net durchzuf uhren, wobei die randomisierte Datenspei- 
cherung die Verf ahrensschritte gemaiS einem der An- 
spriiche 1 bis 14 umfaSt. 

Um eine randomisierte Datenspeicherung in Speichernetz- 

3 0 werken und/oder einem Intranet und/oder dem Internet 

durchzuf uhren , wird vorteilhaf terweise ein computerles- 
bares Speichermedium eingesetzt, auf dem ein Programm 
gespeichert ist, das es einem Computer ermoglicht, 
nachdem es in den Speicher des Computers geladen worden 
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ist, ein Verfahren zur randomisierten Datenspeicherung 
in Speichernetzwerken und/oder einem Intranet und/oder 
dem Internet durchzufuhren, wobei die randomisierte 
Datenspeicherung die Verf ahrensschritte gemaS einem der 
5 Anspruche 1 bis 14 umfaSt. 

In einer bevorzugten Ausf uhrungsf orm des erfindungs- 
gemaSen Verf ahr ens ist vorgesehen, dass bei dem ersten 
und/oder zweiten Zuf allsprozefe pseudo-zuf allige 
10 Funktionen angewendet werden. 

Als ein weiterer Vorteil erweist es sich, wenn Daten- 
speichersysteme Sj , deren Wert cj des vorgebbaren Para- 
meters einen ebenfalls vorgebbaren zweiten Wert 8 uber- 

neue virtuelle Datenspeichersysteme Sj - 



steigt, in 



8 ^ 0 - in ein 



15 mit cj- = 8 und - falls Cj - ^ 

weiteres virtuelles Datenspeicher system S k mit c k = Cj - 
c ■ 

* 8 zerlegt werden und diesen virtuellen Daten- 

speichersystemen durch den ersten Zuf allsprozeS jeweils 
mindestens ein Teilraum Ij- bzw. I k des virtuellen 
2 0 Speicherraums zugeordnet wird, wobei [a J den ganzzah- 

ligen Anteil einer Zahl a e 3 beschreibt. 

Des weiteren ist es von Vorteil, wenn der virtuelle 
Speicherraum durch das Intervall [0,1) und die Teil- 
raume Ij durch mindestens ein in [0,1) enthaltenes 

2 5 Teilintervall reprasentiert werden und im ersten Zu- 

fallsprozefe durch die Anwendung einer ersten Hash- 
Funktion g(j) der linke Rand des Intervalls Ij ermit- 
telt und die Lange des Intervalls gemaS (g(j) + s * cj) 
berechnet wird, mit: 

3 0 Cji Wert des auf das Datenspeicher system Sj bezogenen 

Parameters und 
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s: Stretch-Faktor, der so gewahlt ist, da£ s * Cj < 1 
erfullt ist. 

Von Vorteil ist es dabei, wenn der Stretch-Faktor s 
derart gewahlt wird, dass das Intervall [0,1) vollstan- 
5 dig durch die Teilintervalle Ij uberdeckt wird. 

Im zweiten Zuf allsprozefi wird vorteilhaf terweise durch 
die Anwendung einer zweiten Hash-Funktion h(i) jedem 
Datenblock D± (i=l, . m) eine Zahl h(i) e [0,1) 
zugeordnet . 

10 In einer bevorzugten Ausfuhrungsf orm des Verfahrens zur 
randomisierten Datenspeicherung ist vorgesehen, dass 
der vorgebbare Parameter die physikalische Kapazitat 
von Datenspeichersystemen oder die Anfragelast von 
Datenspeichersystemen beschreibt oder Abweichungen von 

15 der gewunschten Verteilung korrigieren. 

In dem Fall, dass das einem Datenblock D± zugeordnete 
Element h(i) in mehreren Teilraumen Ij enthalten ist, 
erweist es sich als vorteilhaf t, dass eine uniforme 
Platzierungsstrategie angewendet wird, urn den Daten- 

2 0 block D± einem der durch die Teilraume Ij reprasen- 

tierten Datenspeichersystem zuzuordnen. 

Daruber hinaus ist es von Vorteil, dass bei Anderungen 
mindestens eines der Werte C=(c x , c n ) des vorgeb- 

baren Parameters eine erneute Zuordnung der Datenblocke 
25 Di zu den Datenspeichersystemen Sj nach dem Verfahren 
zur randomisierten Datenspeicherung gemafe einem der An- 
spruche 1 bis 9 unter Zugrundelegung der neuen Para- 
meterwerte C'=(c 1 <, c n -) erfolgt. 

In bestimmten Fallen kann es niitzlich sein, bei nur 

3 0 geringen Anderungen von Werten des vorgebbaren Para- 

meters keine Neuverteilung der Datenblocke vorzunehmen. 
Dies wird erreicht, indem bei Anderungen mindestens 
eines der Werte C=(c lf c n ) des vorgebbaren Para- 

meters eine erneute Zuordnung der Datenblocke Di zu den 
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Datenspeichersystemen Sj nach dem Verfahren zur rando- 
misierten Datenspeicherung gemaS einem der Anspriiche 1 
bis 9 unter Z ugrunde 1 egung der neuen Parameterwerte 
C'=(cx', . c n r) nur erfolgt, wenn ein neuen Para- 

5 meterwert Ci* sich von dem entsprechenden aktuellen 
Parameterwert ci urn einen vorgebbaren Wert |Li unter- 
scheidet . 

Bei groJSen Anderungen des vorgebbaren Parameters 
wiederum werden Anpassungen des Systems vorteilhaf ter- 

10 weise vorgenommen, indem bei Anderungen mindestens 
eines der Werte C=(c 1/ c n ) des vorgebbaren 

Parameters in einen neuen Parameterwert C / =(c 1 r / . 
c n 'j stufenweise eine ( erneute Zuordnung der Datenblocke 
Di zu den Datenspeichersystemen Sj nach dem Verfahren 

15 zur randomisierten Datenspeicherung gemaS einem der 
Anspriiche 1 bis 9 erfolgt, wobei in jeder Stufe k 
Zwischen-Parameterwerte C k =(c k 1 , c k n ) mit | c± - c k ±j 

< jc± - c'ij (i = 1, n) zugrundegelegt werden. 

Dieses Vorgehen hat den groEen Vorteil, dass das System 

2 0 im Gegensatz zu einem direkten Update wesentlich 
schneller auf hohe Anf ragebelastungen oder eine neue, 
vom Administrator gewahlte Kapazitatsverteilung C' 
reagieren kann, da in jedem C 1 der Ubergangsprozess von 
C nach C ' abgebrochen werden kann . 

2 5 Dariiber hinaus ist es von Vorteil, dass zur 

Abspeicherung der Datenblocke in einem Speichermedium 
mindestens eine Tabelle bereitgestellt wird, in denen 
die Zuordnung zwischen virtueller Adresse und 
physikalischer Adresse auf dem Speichermedium abge- 

3 0 speichert ist. 

Ein weiterer Vorteil des erf indungsgemaSen Verfahrens 
zur randomisierten Datenspeicherung besteht darin, dass 
mehrere Datenblocke zu einem Extent zusammengef asst 
werden, denen in der Tabelle eine gemeinsame physika- 
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lische Adresse auf dem Speichermedium zugeordnet wird, 
wobei die Datenblocke eines Extents im logischen 
Adressraum rniteinander verbunden sind, indem der erste 
Datenblock eines aus 2 X Datenblocken bestehenden 
5 Extents eine Adresse der Form x00...000 erhalt, wobei 
die unteren A Bits Null sind, der letzte Block dieses 
Extents die Adresse xll...lll erha.lt, wobei die unter- 
sten A Bits Eins sind, und die physikalische Position 
eines Datenblocks durch eine Addition des Tabellen- 
10 eintrags fur den zugehorigen Extent mit den letzten X 
Bits der logischen Adresse des Datenblocks gewonnen 
wird. Durch dieses Vorgehen wird die Anzahl von zu 
sichernden Tabelleneintragen reduziert. 

15 In einer bevorzugten Ausf uhrungsf orm der Erfindung ist 
vorgesehen, dass die Anordmmg mindestens einem Daten- 
speichersystem und/oder mindestens einem Computer- 
system, das (die) lesend und/oder schreibend auf die 
Speichermedien zugreift (zugreifen) , und/oder minde- 

20 stens eine zwischen das (die) Computer system (e) und das 
(die) Datenspeichersystem(e) geschaltete Kontroller- 
Einheit zur Steuerung des Verfahrens randomisierten 
Datenspeicherung umfasst. Die Datenspeichersysteme 
umf assen dabei vorteilhaf terweise Fes tplattenf elder 

2 5 und/oder als Web-Cashes ausgebildete Zwischenspeicher 

Weiterhin stellt es sich als vorteilhaf t heraus, wenn 
die Anordnung mindestens eine zwischen das (die) Corn- 
put er system (e) und das (die) Datenspeichersystem(e) ge- 
schaltete Kontroller-Einheit zur Steuerung des Ver- 

3 0 fahrens zur randomisierten Datenspeicherung umfasst. 

Dabei kann es sich als nutzlich erweisen, dass das Ver- 
fahren zur randomisierten Datenspeicherung als Hard- 
ware-RAID-Verf ahren in der Kontroller-Einheit implemen- 
tiert ist. 
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In einer weiteren bevorzugten Ausf lihrungsf orm der Er- 
f indung ist vorgesehen, dass die Anordnung mindestens 
ein dediziertes , liber Mittel zum Datenaustausch mit 
Speichermedien und Computersystemen der Anordnung ver- 
5 bundenes Computer system ( SAN-Appliance) zur Koordina- 
tion der Datenspeicherung und/oder liber Mittel zum 
Datenaustausch mit Speichermedien und Computersystemen 
der Anordnung verbundene Rechenressourcen (In-Band- 
Appliances) zur Verteilung der Datenblocke umfasst. 
10 Ebenso stellt es einen Vorteil dar, dass die Anordnung 
heterogene Speichermedien umfasst. 

Die Erfindung soil nachstehend anhand von zumindest 
teilweise in den Figuren dargestellten Ausf tihrungs- 
15 beispielen naher erlautert werden. 

Es zeigen: 

Fig. 1 Aufbau eines Speichernetzwerkes , 
Fig. 2 Veranschaulichung der Out-of-Band Virtuali- 

sierung des Datenraums, 
Fig. 3 Veranschaulichung der In-Band Virtuali- 
sierung, 

Fig. 4 Aufteilung der virtuellen Adresse eines 
Datenblocks zur Bestimmung der zugehorigen 
Festplatte und des zugehorigen Metablocks . 

Wie aus dem Anf orderungsprof il an die Datenverwaltungs- 
strategie ersichtlich wird, ist die Losung der Aufga- 
3 0 bens tel lung im Allgemeinen davon abhangig, ob die an 
ein System angeschlossenen Clients 3 liber alle fur die 
Datenverteilung notwendigen Informationen verfligen. Im 
Folgenden wird das erf indungsgemafie Verfahren, welches 
nachfolgend als Share-Strategie bezeichnet wird, 



20 
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vorgestellt, welches in der Lage ist, in beiden Fallen 
nahezu optimale Verteilungs- und Zugrif f seigenschaf ten 
zu garantieren. 

5 Nachfolgend werden kurz Voraus setzungen und Definitio- 
nen vorgestellt, die bei der Beschreibung des Ausfiih- 
rungsbeispiels benutzt werden. 

Die Anzahl der in einem System zu speichernden Daten- 
10 blocke wird mit m, die Anzahl der maximal verwendbaren 
Datenspeichersysteme mit N bezeichnet. N wird dabei 
durch die Datenplatzierungsstrategie vorgegeben und ist 
nicht von der aktuellen Anzahl und GroSe der Daten- 
speichersysteme abhangig. Die Anzahl der in dem System 
15 tatsachlich verfugbaren Datenspeichersysteme wird mit n 
bezeichnet. Fur den Fall, dass die Anzahl der von den 
Datenspeichersystemen speicherbaren Datenblocke kleiner 
als m ist, ist es erf orderlich, dass ein weiteres Spei- 
chersystem zur Verfugung gestellt wird, in das aktuell 
2 0 nicht abbildbare Datenblocke ausgelagert werden konnen. 

Der Anteil der Datenblocke, die von einem Datenspei- 
chersystem i gespeichert werden konnen, wird als rela- 
tive Kapa.zita.t ci e [0,1] bezeichnet, wobei £i c ± = 1 . 

2 5 Die Grofie der individuellen Ci kann dabei von verschie- 

denen Faktoren abhangen, so z. B. von der Speicher- 
kapazitat, wenn es sich urn eine Festplatte handelt, 
oder von der Bandbreite der angeschlossenen Verbin- 
dungen bei einem Web-Cache. Zielsetzung einer Daten- 

3 0 platzierungsstrategie sollte es sein, dass auf jedem 

Datenspeicher system i bei m zu platzierenden Daten- 
blocken c± * m Datenblocke gespeichert werden. Bei der 
Beschreibung der umzusetzenden Techniken wird nicht 
davon ausgegangen, dass sich die Anzahl der Datenspei- 
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chersysteme in dem System verandert . Diese Situation 
kann dadurch modelliert werden, dass die relative 
Kapazitat Ci eines Datenspeicher systems i, das sich zum 
Zeitpunkt t nicht in dem System befindet, zu diesem 
5 Zeitpunkt auf Null gesetzt wird. 

Die Aufgabe der Datenverteilungsstrategie kann nun in 
zwei Aufgabenpunkte untergliedert werden. In einem er- 
sten Schritt muss ein Datenblock mit seiner virtuellen 

10 Adresse einem Datenspeichersystem zugeordnet werden. 
Diese Zuordnung wird im Folgenden auch als globale 
Datenverteilung- bezeichnet. In einem zweiten Schritt 
muss der Datenblock nicht nur einem Datenspeicher- 
system, sondern zusatzlich auch einer Position auf 

15 diesem Datenspeichersystem zugeordnet werden. Diese Zu- 
ordnung wird im Folgenden auch als lokale Daten- 
verteilung bezeichnet. Die Erfindung beschaftigt sich 
mit dem Problem der globalen Datenverteilung . Im Rahinen 
der Beschreibung des erf indungsgemafeen Verfahrens wer- 

2 0 den kurz einfache lokale Datenverteilungsstrategien 
vorgestellt, die unsere neuen globalen Datenvertei- 
lungsstrategien erganzen. 

Eine Voraussetzung fur den Einsatz der Share- Strategie 
2 5 ist es, dass sie als Subroutine eine Funktion verwenden 
kann, die das Problem der Datenverteilung fur uniforme 
Datenspeichersysteme lost, d. h. fur den Fall, dass Ci 



= y fur alle i. Mogliche Strategien fur den uniformen 
/ n 

Fall sind in [KLL+97 ] und [BBS00] vorgestellt worden. 



Die Share-Strategie wird nun im Detail beschrieben: In 
Share werden jedem Speichersystem ein oder mehrere 
Intervalle zugeordnet, deren GesamtgroEe der relativen 
Kapazitat des Systems entspricht. Diese Intervalle 
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werden auf ein [ 0 , 1 ) -Intervall abgebildet, konnen sich 
aber im Gegensatz zu fruheren Strategien mit anderen 
Intervallen uberlappen. Jedem Datenblock wird nun 
mittels einer (pseudo- ) zuf alligen Funktion ein reeller 
5 Punkt im [ 0 , 1) -Intervall zugewiesen. Dieser Punkt kann 
eventuell zu mehreren Intervallen von Speichersystemen 
gehoren. Falls dem so ist, wird eine uniforme 
Platzierungsstrategie verwendet, urn den Datenblock 
einem dieser Speichersysteme zuzuweisen. Verandern sich 
10 nun die relativen Kapazitaten der Speichersysteme, so 
werden die Interval llangen entsprechend angepasst. 

Im Folgenden werden wir zunachst eine detaillierte Be- 
schreibung der Share-Strategie geben und anschlieSend 
15 darlegen, warum sie anderen Strategien iiberlegen ist. 

Die von der Share-Strategie verwendete Strategie fur 
uniforme Datenspeichersysteme wird im Folgenden als 
Unif orm(b, S) bezeichnet, wobei jb die virtuelle Adresse 
2 0 des Datenblocks und S die Menge der Datenspeicher- 
systeme beschreibt. Die Ruckgabe der Funktion liefert 
das Datenspeichersystem, auf das der Datenblock Jb 
platziert wird. 

2 5 Die Share-Strategie basiert auf zwei zusatzlichen Hash- 

Funktionen, die neben den moglicherweise fur die uni- 
forme Strategie verwendeten Hash-Funktionen bereitge- 
stellt werden mussen. Die Hash-Funktion h: 
{1, . . . ,2tf} — > [0,1) verteilt die Datenblocke pseudo- 

3 0 zufallig uber das Intervall [0,1). Eine weitere Hash- 

Funktion g: {1,..., N} [0,1) ordnet den beteiligten 

Datenspeichersystemen einen Punkt in dem Intervall 
[0,1) zu. Weiterhin werden die Parameter s, 8 e [1/N, 1] 
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verwendet, deren Bedeutung im weiteren Verlauf 
erlautert wird. 

Es wird angenommen , dass n Datenspeichersysteme mit 
(ci # ...,c n ) e [0,l) n gegeben sind. Es wird dann die 
folgende Strategie verwendet: Fur jedes Datenspeicher- 



system mit c± > 8 werden 



neue virtuelle Datenspei- 



L<?J 

chersysteme i' mit ci- =5 eingefugt. Entspricht die 
Suirane der relativen Kapazitaten der virtuellen Daten- 
10 speichersysteme nicht der ursprunglichen Kapazitat, 
wird ein zusatzliches virtuelles Datenspeichersystem j 

mit Cj = Ci - — * 8 eingefugt. Datenspeichersysteme, 

_Sj 

deren Demand kleiner als S sind, werden in ihrer 
ursprunglichen Form belassen und als einzelne, vir- 
15 tuelle Datenspeichersysteme angesehen. Durch die 
Transformation der Datenspeichersysteme werden maximal 
n ' < n + 1/8 virtuelle Datenspeichersysteme erzeugt. 

Jedem virtuellen Datenspeichersystem i wird nun ein 
2 0 Interval 1 Ii der Lange s * c± zugeordnet, das von g(i) 
bis (g(i) + 3 * Cij modi reicht. Der [ 0 , 1) -Bereich wird 
also als Ring angesehen, urn den die einzelnen Inter- 
valle gewickelt werden. Die Konstante s wird als 
Stretch-Faktor bezeichnet. Urn zu verhindern, dass ein 

2 5 einzelnes Interval 1 mehrfach urn den Ring gewickelt 

wird, sollte 8 < j/ gewahlt werden. Ein 8 > j/ ist 

moglich, erschwert jedoch die Umsetzung des Verfahrens. 

Fur jedes x e [0,1) sei C x = fir x e I±} die Menge der 

3 0 Intervalle, in denen x enthalten ist. Die Anzahl der 

Elemente c x = |c x | in dieser Menge wird als Contention 
bezeichnet. Da die Anzahl der Endpunkte der Intervalle 
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der virtuellen Datenspeichersysteme maximal 

2n < 2 (n + ^ ) betragt, wird das [0 , 1) -Interval! in 

maximal 2 (n + J/^ ) Rahmen Fj e [0,1) aufgeteilt, so 

dass fur jeden Rahmen Fj die Menge C x fur jedes x g Fj 
5 identisch ist. Die Beschrankung der Anzahl der Rahmen 
ist wichtig, um die GroSe der Datenstrukturen fur die 
Share-Strategie zu begrenzen. 

Die Berechnung des zu einem Datenblock zugehorigen 
10 Datenspeichersystems erfolgt nun durch den Auf ruf : 
Uniform(b, C h {b) ) • 

Ein wichtiger Vorteil der Erfindung besteht wie erwahnt 
darin, daS sie die Behandlung von Anderungen im Spei- 
15 chernetzwerk 1 in auEerst einfacher Weise gestattet. Je 
nach Anforderung kann es sich dabei als sinnvoll 
erweisen, auf sich andernde Umgebungen mit einer 
Adaption der Share-Strategie zu reagieren. 

2 0 Bisher wurde erlautert, wie die Platzierung von Daten- 
blocken in einem statischen System vorzunehmen ist. Es 
wird nun angenommen, dass sich die Verteilung der 
relativen Kapazitaten in dem System von C=(c lf c n ) 
auf C'^fci', c n ! ) verandert. Wie oben erlautert, 

25 umfasst dieses auch den Fall, dass neue Datenspeicher- 
systeme in das System eintreten, bzw. Datenspeicher- 
systeme das System verlassen. Es sind nun verschiedene 
Varianten denkbar, um einen Ubergang von C nach C 1 
vorzunehmen . 

30 

Variante 1: Direct Update 

Die einfachste Methode besteht darin, direkt von C nach 
C uberzugehen und die entsprechenden Umplatzierungen 
vorzunehmen. Das hat den Nachteil, dass selbst bei 
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kleinsten Veranderungen wegen der Verwendung pseudo- 
zufalliger Funktionen eventuell Ump 1 a t z i e rung en von 
mehreren Datenblocken vorgenommen werden mussen, und 
bei groSen Veranderungen das System sich lange in einem 
5 Ubergangszustand befindet, was die Auf rechterhaltung 
des oben genannten vierten Punktes der Anf orderungen an 
Datenverwaltungsstrategien gefahrden kann. 

Variante 2 : Lazy Update 
10 Im Folgenden wird eine Strategie vorgestellt, die dafur 
sorgt , dass bei sehr geringen Kapazi tats veranderungen 
keine Daten umzuverteilen sind. 

Sei 0 < |JL < 1 eine feste Konstante, die als Tragheit 
15 der Share-Strategie bezeichnet wird. Die Share- 
Strategie andert die relative Kapazitat eines 
Datenspeichersystems i nur dann von ci auf c± 1 , wenn 
ci 1 > (1 + |LL) ci oder ci' < (1 - |l)Ci. Hierdurch. kann die 
Suirane der relativen Kapazi tat en liber alle 
2 0 Datenspeichersysteme von 1 abweichen, bleibt jedoch im 
Bereich von 1 ± (l, so dass bei kleinem |LL die 
Eigenschaf ten der Share-Strategie nicht gefahrdet sind. 

Variante 3 : Smooth Update 

2 5 Diese Variante ist sinnvoll fur den Fall groiSer Kapazi- 

tatsanderungen. Falls C und C* grofie Kapazitats- 
abweichungen haben, werden zunachst Zwischenstuf en 
Ci, C 2 , C 3 ,-.. f C t berechnet, so dass mit C=C 0 und C 1 =C t +i 
fur jedes i in {0,...,t} d und C i+ i eng genug beisammen 

3 0 liegen, dass es dem System moglich ist, schnell von der 

einen zur anderen Kapazi tatsverteilung und dam it in 
einen stabilen Zustand uberzugehen. Dieser Prozess hat 
den groEen Vorteil, dass das System im Gegensatz zum 
Direct Update wesentlich schneller auf hohe 
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Anf ragebelastungen oder eine neu vom Administrator 
gewahlte Kapazitatsverteilung C" ' reagieren kann, da in 
jedem Ci der Ubergangsprozess von C nach C abgebrochen 
werden, kann. 

5 

Konkrete Umsetzungen der Verfahren werden in der 
weiteren Beschreibung erlautert. 

Wahl der Kapazitaten: 

10 

Die Wahl der Kapazitaten fur Share muss sich nicht not- 
wendigerweise nach der physikalischen Kapazitat eines 
Speichersystems richten. Da Share beliebige Kapazitats- 
verteilungen zulasst, konnen die Share-Kapazitaten auch 

15 dazu benutzt werden, urn eine bessere Balancierung der 
Anf ragelast vorzunehmen, urn zum Beispiel Engpasse in 
den Verbindungen zu Speichersystemen oder in den 
Speichersystemen selbst zu beseitigen. Des Weiteren 
konnen sie benutzt werden, urn Abweichungen von der 

2 0 gewtinschten Verteilung (die wegen der Verwendung 
pseudo-zuf alliger Hash-Funktionen nicht auszuschlieKen 
sind) auszugleichen. Die Share Strategie erlaubt also 
eine hohe Flexibilitat in der Verteilung der Daten und 
eine hohe Robustheit, und erfullt damit wichtige 

2 5 Anf orderungen an ein Speichersystem. 

Nachfolgend werden noch einige spezielle Aspekte des 
erf indungsgemaSen Verfahrens erlautert: 

30 1. Abdeckung des [ 0 , 1 ) -Intervalls 

Damit sichergestellt werden kann, dass die Share- 
Strategie jedem Datenpunkt ein Datenspeichersystem zu~ 
weisen kann, muss das [ 0 , 1) -Interval 1 vollstandig durch 
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die Intervalle der virtuellen Datenspeichersysteme ab- 
gedeckt werden. Dieses kann bereits durch die Hash- 
Funktion g sichergestellt sein, indem nach der Vertei- 
lung der Intervalle der Datenspeichersysteme die Ab- 
5 deckung uberpruft wird und gegebenenf alls einzelne 
Intervalle verschoben werden. Bei einer zufalligen 
Platzierung der Intervalle durch eine p s eudo - randomi - 
sierte Hash-Funktion h ist es jedoch ausreichend, einen 
Stretch-Faktor s = k * In n mit k > 3 zu verwenden, so 
10 dass mit hoher Wahrscheinlichkeit die Intervalle der 
Datenspeicher Systeme das [0,1) -Intervall abdecken . 
Hohe Wahrscheinlichkeit bedeutet hier, dass die 
Wahrscheinlichkeit, dass ein Bereich nicht abgedeckt 
wird, kleiner als V ist. Ergibt die Kontrolle der 

15 Verteilung der Intervalle, dass nicht jeder Punkt des 
[ 0 , 1) -Intervalls abgedeckt ist, so kann die Abdeckung 
durch eine Adaption des Stretch-Faktors erfolgen. 

2 . Benotigter Speicherplatz und Rechenkomplexitat 

20 

Wird die in [KLL+97] vorgestellte Strategie als 
homogene Datenplatzierungsstrategie Uniform (b, S) 

verwendet, so liegt die erwartete Zeit, das zu einem 
Datenblock zugehorige Datenspeichersystem zu berechnen, 
25 in 0(1). Die Speicherkomplexitat zur Berechnung der 
Share-Strategie liegt in 0(s * k * (n + j/g ) ) - Nicht 

mitgezahlt sind hier die Speicher- und Berechnungs- 
komplexitat der verwendet en Hash-Funktionen. 

3 0 3. Gtite der Verteilung 

Werden pseudo-randomisierte Hash-Funktionen verwendet 
und wird ein Stretch-Faktor s > 6 In (Itf/G 2 ) mit 
a - £/(l + £) gewahlt, so bewegt sich der Anteil der 
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Datenblocke, die von einem Datenspeichersystems i 
gespeichert werden, mit hoher Wahrscheinlichkeit in dem 
Bereich S± e [ (1 - £)<3l±, (1 - e) . 

5 In den folgenden Abschnitten wird dargestellt, wie der 
Aufbau von Datenspeichersystemen mit Hilfe der Share- 
Strategie effizient durchgefuhrt werden kann. Es wird 
darauf hingewiesen, dass es sich dabei lediglich urn 
Implementierungsbeispiele handelt. In einem ersten 
10 Schritt wird vorgestellt, wie die Funktionalitat in ein 
allgemeines RAID-System integriert werden kann: 

Integration der Share-Strategie in ein allgemeines 
RAID- System: 

15 

Die Share-Strategie kann verwendet werden, urn in 
Systemen, die aus einer Menge von Speichermedien, aus 
mehreren Computer systemen und einer Kontroller-Einheit 
bestehen, Fes tplattenf elder aufzubauen. Dabei kann die 
0 Share-Strategie sowohl in dem angeschlossenen Computer- 
systemen als Software-RAID Verfahren integriert werden, 
als auch in der Kontroller-Einheit als Hardware-RAID 
Verfahren. Die Share-Strategie ist dabei fur die Zuord- 
nung der Datenblocke uber die Festplatten zustandig, 
5 die Zuordnung des Datenblocks zu einer physikalischen 
Adresse auf der Festplatte wird von einer unter der 
Share-Strategie liegenden Strategie ubernommen . Eine 
Moglichkeit fur die Zuordnung der physikalischen Posi- 
tion besteht in der Bereitstellung von Tabellen, in 
0 denen eine Zuordnung zwischen virtueller Adresse und 
physikalischer Adresse auf der Festplatte abgespeichert 
wird. 
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Es ist dabei moglich, die Anzahl der zu sichernden 
Tabelleneintrage zu reduzieren, indem nicht jedem 
einzelnen Datenblock ein eigener Eintrag zugeordnet 
wird, sondern indem Blockmengen minimaler Grofee, im 
5 Folgenden auch als Extents bezeichnet, uber einen 
gemeinsamen Eintrag in der Tabelle verfugen . Bei einem 
Extent handelt es sich urn eine Menge von Blocken, die 
in dem logischen Adressraum miteinander verbunden sind. 
Ein Extent besteht aus 2 A Blocken. Der erste Block des 

10 Extents hat eine Adresse der Form xOO... 000, wobei die 
unteren A Bits 7 durch die Ziffer Null reprasentiert 
sind. Der letzte Block des Extents hat die Adresse 
wobei die untersten A Bits 7 durch die 
Ziffer Eins reprasentiert sind. Die physikalische 

15 Position eines Datenblocks wird durch eine Addition des 
Tabelleneintrags fur den zugehorigen Extent mit den 
unteren A Bits 7 der logischen Adresse des Datenblocks 
gewonnen . Hat jeder Tabelleneintrag die Form yOO . . . 000 r 
d. h. die unteren A Bits 7 werden Null gesetzt, kann 

2 0 die Addition durch eine einfache ODER-Verknupf ung 

durchgefuhrt werden. Die oberen Bits 6 der virtuellen 
Adresse eines Datenblocks dienen also zur Berechnung 
des zugeordnet en Speichermediums und der Bestimmung des 
Tabelleneintrages fur den Extent, die unteren Bits 7 
25 dienen als Offset innerhalb des Extents. Allen Daten- 
blocken, die uber gemeinsame obere Bits 6 verfugen, 
wird ein Tabelleneintrag zugeordnet. Dieser Tabel- 
leneintrag kann z. B. an der Stelle gespeichert werden, 
an der auch die Berechnung der Share- Strategie durch- 

3 0 gefuhrt wird. 

Integration der Share- Strategie in ein Speichernetzwerk 1: 
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Die Integration der globalen Datenverteilungsstrategien 
in ein Speichernetzwerk 1 geht von einer Struktur gemafi 
Figur 1 aus . Das Gesamt system besteht aus einer Menge 
von Datei- oder Datenbankservern, im Folgenden als 
5 Computersysteme bezeichnet, die uber ein Speichernetz- 
werk 1 an Datenspeichersysteme 4 angeschlossen sind. 
Das Speichernetzwerk 1 umfaEt weiter eine Menge von 
Switches bzw. Routern 2, die die Zustellung der Daten- 
pakete zwischen kommunizierenden Einheiten sicherstel- 

10 len. Die Computersysteme sind in dem hier vorliegenden 
Kontext als Clients 3 zu betrachten, die von den Daten- 
speichersystemen 4 Blocke lesen, oder auf den Daten- 
speichersystemen 4 Datenblocke schreiben. Mit Hilfe der 
Share-Strategie kann jede beliebige Teilmenge M der an 

15 das Speichernetzwerk 1 angeschlossenen Speichersysteme 
4 wie ein einziger logischer Speicherpool verwaltet 
werden, der uber einen linearen Adressraum verf ugt . Die 
Menge der Speichersysteme 4 kann dabei in mehrere 
kleinere oder einen groilen Speicherpool aufgeteilt 
0 werden, wobei keine der Speichersysteme 4 mehr als 
einem Speicherpool zugeordnet werden sollte. Es wird im 
Folgenden nur der Fall betrachtet, dass das System aus 
einem Speicherpool besteht. 

5 Aus einem Speicherpool konnen mehrere virtuelle Spei- 
chersysteme aufgebaut werden, wobei jedes dieser vir- 
tue 11 en Speichersysteme gemaE der Share- Strategie ver- 
waltet wird. Besteht ein Speicherpool aus einer 
Teilmenge M der Speichersysteme, so erfolgt der Aufruf 
0 der Share-Strategie fur die logischen Speichersysteme 
gemaS der gesamten Teilmenge M. Jedem virtuellen Spei- 
chersystem wird eine Speicher-Policy zugeordnet die 
Eigenschaf ten wie physikalische BlockgroBe und Redun- 
danz umfasst. Diese Zuordnung kann separat fur jedes 



WO 2004/021214 



PCT/EP2003/008635 



30 



virtuelle Speichersystem oder einmal fur den gesamten 
Speicherpool erfolgen. Nachdem Daten auf eine virtuelle 
Festplatte geschrieben wurden, kann die Speicher-Policy 
im Allgemeinen nicht mehr verandert werden. 

5 

Wird von einem Computer system auf einen Extent zuge- 
griffen, der bisher von dem Computer system noch nicht 
verwendet wurde und fur den kein Tabelleneintrag in 
diesem Computer system vorliegt, muss ein neuer Tabel- 
10 leneintrag allokiert werden. Die Allokation kann auf 
zwei Arten erfolgen: 



1. Das Computer system fragt bei einer zentralen In- 
stanz, die uber globales Wissen liber alle Tabel- 

15 leneintrage verfugt, nach einem Tabelleneintrag fur 

das Extent, 

2. Auf jedem Speichersystem 4 ist ein Bereich reser- 
viert, der eine Zuordnung zwischen virtueller 
Adresse und physikalischer Adresse vornimmt . Das 

2 0 Computersystem sucht zuerst nach der virtuellen 

Adresse des Extents. Falls diese Adresse noch nicht 
reserviert ist, sucht das Computersystem nach einer 
noch freien Adresse auf dem Speichersystem 4. 



2 5 Wird die Koordination nicht durch eine zentrale Instanz 

vorgenommen, so muss diese Aufgabe nach Figur 1 von 
einem oder mehreren der angeschlossenen Computersysteme 
ubernommen werden. Weiterhin konnen jedoch auch ein 
oder mehrere dedizierte Gerate, die als SAN-Appliances 

3 0 5 bezeichnet werden, zur Koordination der Computer- 

systeme gemafi Figur 2 an das Speichernetzwerk 1 ange- 
schlossen werden. Neben der Entlastung der Computer- 
systeme urn die Koordination kann durch den Einsatz von 
SAN-Appliances 5 sichergestellt werden, dass alle 
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angeschlossenen Computersysteme die gleiche Sicht auf 
die Speichersysteme 4 haben, d. h. zum gleichen Zeit- 
punkt liber das Verlassen bzw. Hinzukornmen von Speicher- 
systemen 4 informiert werden. 

5 

Die SAN-Appliance 5 bietet somit eine Reihe von 
Schnittstellen, uber die Inf ormationen zwischen dem 
SAN- Appliances 5 und den Client-Rechnern 3 ausgetauscht 
werden konnen. Diese umfassen: 

10 

- Anfrage der Grundkonf iguration von jedem Client 3, 

- Anfrage nach neuen Extents von jedem Client 3, 

- Information der Clients 3 uber Veranderungen der 
Inf rastruktur . 

15 

Das Share-Verfahren kann auch in so genannte In-Band- 
Appliances integriert werden (siehe Figur 3). Bei den 
In-Band- Appliances handelt es sich urn dedizierte 
Systeme, die eine Transformation der logischen Adresse 

2 0 eines Datenblocks , die sie von den angeschlossenen 
Computersystemen erhalten, in die physikalische Adresse 
vornehmen. Der Einsatz von In-Band-Appliances ist dann 
notwendig, wenn die Funktionalitat der Share-Strategie 
nicht in die Computersysteme direkt integriert werden 

2 5 kann, da keine Software-Version der Share-Strategie fur 
diese Computersysteme verfiigbar ist oder die Leistung 
der angeschlossenen Computersysteme nicht ausreichend 
grog ist, urn die Transformation der logischen Adressen 
in die physikalischen Adressen durchzuf iihren . 

30 

Eine In-Band-Appliance verhalt sich aus Sicht der Spei- 
chersysteme 4 wie ein angeschlossenes Computer system, 
aus der Sicht der an die In-Band-Appliance 
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angeschlossenen Computersysteme wie ein physikalisches 
Speichersystem. 

In dem Speichernetzwerk 1 konnen In -Band- Appliances mit 
5 Computersystemeii; in denen die Share-Strategie ausge- 
fuhrt wird, gemischt werden . 

Aufbau von Internetsystemen mit Hilfe der Share- 
Strategie : 

10 

Die Problems tellung beim Aufbau von Systemen zur Aus- 
lieferung von Datenob j ekten liber das Internet 
unterscheidet sich von dem Aufbau von Speicher systemen 
in sofern, dass Clients 3 in dem Internet keine globale 
15 Sicht uber alle verfugbaren Web-Server und Web-Caches 
in dem System haben. Soil ein Datum von eineiti Web-Cache 
gelesen werden, urn die teilnehmenden Web-Server zu 
entlasten, muss also sichergestellt werden, dass der 
Client 3 mindestens einen zu einem Datenob jekt 

2 0 gehorenden Web-Cache kennt und das zu lesende Daten- 

ob j ekt auch dem richtigen Web-Cache zuordnen kann. 

Diese Aufgabens tellung kann im Allgemeinen nicht gelost 
werden, ohne dass von einem Datenob jekt mehrere Kopien 
25 angelegt werden, die liber die Web-Caches gemaE einer 
vorgegebenen Platzierungsstrategie verteilt werden . 
Werden von einem System von jedem Datenob jekt k Kopien 
gespeichert, so fragt der Client 3 nacheinander oder 
gleichzeitig bei den k Web-Caches nach, von denen er 

3 0 glaubt, dass sie eine Kopie des Datenobj ektes spei- 

chern. Halt einer der Web-Caches eine Kopie des Daten- 
Obj ektes, so wird diese Kopie anschlieSend von dem 
Client 3 gelesen. 
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Die Anzahl der no t wend i gen Kopien, damit ein Client 3 
einem Datenobj ekt mindestens einen Web-Cache zuordnet , 
der auch dieses Datenobj ekt speichert, ist von der 
verwendeten Verteilungsstrategie und den relativen 

5 Kapazitaten C = {c x , - c n ) der Web-Caches abhangig. 

Weiterhin ist sie von der Sicht V=(v lf v ny ) des 

Clients 3 abhangig, das heifet von den relativen GroSen 
der Web-Caches, die der Client 3 zu kennen glaubt . Die 
Konsistenz k v der Sicht eines Clients 3 wird wie folgt 

0 definiert: 



n 

K v =£min[v;,cj 



Es kann gezeigt werden, dass bei Verwendung der Share- 
5 Strategie die Verwendung von ©(log N) Kopien ausrei- 
chend ist, urn mit einer Wahrscheinlichkeit von groSer 



garantieren zu konnen, das mindestens fur 



als {l~ 

V n) 

ein Datenobj ekt der Web-Cache, der von der Share - 
Strategie berechnet wird, fur C und V derselbe ist. 

Die Erfindung ist nicht beschrankt auf die hier darge- 
stellten Ausf iihrungsbeispiele . Vielmehr ist es moglich, 
durch Kombination und Modifikation der genannten Mittel 
und Merkmale weitere Ausf uhrungs variant en zu realisie- 
ren, ohne den Rahmen der Erfindung zu verlassen. 
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Pafcentanspruche 



1 . Verfahren zur randomisierten Datenspeicherung in 
5 Speichernetzwerken und/oder einem Intranet und/ 

oder dem Internet, 

dadurch gekennzeichnet , da£ 

eine Menge von Datenblocken Di (i=l, m) einer 

Menge von Datenspeichersystemen Sj (j=l, -../ n) 
0 gemaS den folgenden Schritten zugeordnet und dort 

gespeichert wird: 

a) der Gesamt menge der Datenspeichersysteme wird 
ein virtueller Speicherraum und jedem einzel- 
nen Datenspeichersystem Sj (j=l, . n) durch 

.5 einen ersten Zuf allsprozeiS mindestens ein 

Teilraum Ij des virtuellen Speicherraums 
zugeordnet, wobei das Verhaltnis zwischen dem 
Teilraum Ij und dem gesamten virtuellen Spei- 
cherraum wenigstens naherungsweise dem Ver- 

0 haltnis der auf das Datenspeichersystem Sj 

bzw. auf die Gesamtmenge der Datenspeicher- 
systeme bezogenen Werte eines vorgebbaren 
Parameters entspricht , 

b) jedem Datenblock Di (i=l, . .., m) wird durch 
5 einen zweiten Zuf allsprozeS ein (zufalliges) 

Element h(i) des virtuellen Speicherraums 
zugeordnet , 

c) fur jeden Datenblock Di (i=l, . m) wird 
mindestens ein Teilraum I k ermittelt, in dem 

,0 h(i) enthalten ist, und der Datenblock D± min- 

destens einem der durch diese (n) Teilraume 
(Teilraum) I k reprasentierten Datenspeicher- 
system S k zugeordnet und dort gespeichert. 
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Verf ahren nach Anspruch 1, 
dadurch gekennzeichnet, dafi 

bei dem ersten und/oder zweiten ZufallsprozeE 
pseudo-zuf allige Funktionen angewendet werden. 

Verf ahren nach einem der Ansprliche 1 oder 2 , 
dadurch gekennzeichnet, daJS 

Datenspeichersysteme S j , deren Wert Cj des vorgeb- 
baren Parameters einen ebenfalls vorgebbaren 



C J 



J 



neue virtuelle 



10 zweiten Wert 8 ubersteigt, in 

Datenspeichersysteme S j - mit Cj> =8 und - falls 
8 0 - in ein weiteres virtuelles 



en - 



C J 



Datenspeichersystem Sk mit c k = Cj - 

zerlegt werden und diesen virtuellen Datenspei- 
15 chersystemen durch den ersten Zuf allsprozeE je- 

weils mindestens ein Teilraum Ij* bzw. I k des vir- 
tuellen Speicherraums zugeordnet wird, wobei [a] 

den ganzzahligen Anteil einer Zahl a e 3 be- 
schreibt . 

20 

4. Verf ahren nach einem der vorangehenden Anspruche , 
dadurch gekennzeichnet, dafi 

der virtuelle Speicherraum durch das Intervall 
[0,1) und die Teilraume lj durch mindestens ein in 
25 [0,1) enthaltenes Teilintervall reprasentiert 

werden . 



5. 



Verf ahren nach einem der vorangehenden Anspruche, 
dadurch gekennzeichnet, dafi 
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10 



im ersten Zuf allsprozeS durch die Anwendung einer 
ersten Hash-Funktion g(j) der linke Rand des 
Intervalls Ij ermittelt und die Lange des 
Intervalls gemafi (ff(j) + s * Cj) berechnet wird, 
mit : 

Cj: Wert des auf das Datenspeichersystem Sj 

bezogenen Parameters und 
s: Stretch-Faktor , der so gewahlt ist, daS 
s * cj < 1 erfiillt ist. 

6. Verfahren nach einem der vorangehenden Anspruche, 
dadurch gekennzeich.net , daE> 

der Stretch-Faktor s derart gewahlt wird, dass das 
Intervall [0,1) vollstandig durch die Teilinter- 
15 valle Ij uberdeckt wird. 

7. Verfahren nach einem der vorangehenden Anspruche, 
dadurch gekennzeichnet , daiS 

im zweiten ZufallsprozeS durch die Anwendung einer 
2 0 zweiten Hash-Funktion h(i) j edem Datenblock 

(i=l, m) eine Zahl h(i) e [0,1) zugeordnet 

wird. 

8. Verfahren nach einem der vorangehenden Anspruche, 

2 5 dadurch gekennzeichnet, da£> 

der vorgebbare Parameter 

die physikalische Kapazitat von Datenspeicher- 
systemen oder 

die Anfragelast von Datenspeicher systemen be- 

3 0 schreibt oder 

Abweichungen von der gewunschten Verteilung 
korrigieren. 
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9. Verfahren nach einem der vorangehenden Anspruche, 
dadurch gekennzeichnet, da£ 

in dem Fall, dass das einem Datenblock D± zugeord- 
5 nete Element h(i) in mehreren Teilraumen Ij ent- 

halten ist, eine uniforme Platzierungsstrategie 
angewendet wird, urn den Datenblock D± einem der 
durch die Teilraume Ij reprasentierten Datenspei- 
cher system zuzuordnen . 

10. Verfahren nach einem der vorangehenden Anspruche, 
dadurch gekennzeichnet, dag 

bei Anderungen mindestens eines der Werte 
C-(Cx, .../ c n ) des vorgebbaren Parameters eine 
erneute Zuordnung der Datenblocke Di zu den 
Datenspeichersystemen Sj nach dem Verfahren zur 
randomisierten Datenspeicherung gemafe einem der 
Anspruche 1 bis 9 unter Zugrundelegung der neuen 
Parameterwerte C'-icx*, c n J erfolgt. 

11. Verfahren nach einem der vorangehenden Anspruche, 
dadurch gekennzeichnet, dafe 

bei Anderungen mindestens eines der Werte 
C=(c lr c n ) des vorgebbaren Parameters eine 

erneute Zuordnung der Datenblocke Di zu den 
Datenspeichersystemen Sj nach dem Verfahren zur 
randomisierten Datenspeicherung gemaS einem der 
Anspruche 1 bis 9 unter Zugrundelegung der neuen 
Parameterwerte C / =(c 1 ^ / c n >) nur erfolgt, wenn 

ein neuen Parameterwert c±> sich von dem ent- 
sprechenden aktuellen Parameterwert ci um eine 
vorgebbare Konstante \l unterscheidet . 
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12. Verfahren nach einem der vorangehenden Anspruche, 
dadurch gekennzeichnet, daS 

bei Anderungen mindestens eines der Werte 
5 C=(c lf c n ) des vorgebbaren Parameters in 

einen neuen Parameterwert c'^icx*, . c n <) stu- 

fenweise eine erneute Zuordnung der Datenblocke Di 
zu den Datenspeichersystemen Sj nach dem Verfahren 
zur randomisierten Datenspeicherung gemafi einem 
10 der Anspruche 1 bis 9 erfolgt, wobei in jeder 

Stufe k Zwischen-Parameterwerte &~(c ]c lf . c k n ) 
mit | c± - c k ±j < jci - c'ij (1=1, . . . , n) zugrun- 
degelegt werden. 

13. Verfahren nach einem der vorangehenden Anspruche, 
dadurch gekennzeichnet, daS 

zur Abspeicherung der Datenblocke in einem Spei- 
chermedium mindestens eine Tabelle bereitgestellt 
wird, in denen die Zuordnung zwischen virtueller 
Adresse und physikalischer Adresse auf dem Spei- 
chermedium abgespeichert ist. 

14 . Verfahren nach Anspruch 13 , 
dadurch gekennzeichnet, daS 

2 5 mehrere Datenblocke zu einem Extent zusammen- 

gef asst werden, denen in der Tabelle eine geiuein- 
same physikalische Adresse auf dem Speichermedium 
zugeordnet wird, wobei die Datenblocke eines 
Extents im logischen Adressraum miteinander ver- 

3 0 bunden sind, indem der erste Datenblock eines aus 

2 Datenblocken bestehenden Extents eine Adresse 
der Form x00...000 erhalt, wobei die unteren A 



15 



20 
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Bits durch die Ziffer Null reprasentiert sind, der 
letzte Block dieses Extents die Adresse xll...lll 
erha.lt, wobei die untersten A Bits durch. die Zif- 
fer Eins reprasentiert sind, und die physikalische 
5 Position eines Datenblocks durch eine Addition des 

Tabelleneintrags fur den zugehorigen Extent mit 
den letzten X Bits der logischen Adresse des 
Datenblocks gewonnen wird. 

10 15. Anordnung mit mindestens einen Prozessor, der 
(die) derart eingerichtet ist (sind) , dafi ein Ver- 
fahren zur randomisierten Datenspeicherung in 
Speichernetzwerken und/oder einem Intranet und/ 
oder dem Internet durchfuhrbar ist, wobei die 

15 randomisierte Datenspeicherung die Verfahrens™ 

schritte gema£ einem der Anspruche 1 bis 14 
umfasst . 

16. Anordnung nach Anspruch 15, 

2 0 dadurch gekennzeichnet , da£ 

die Anordnung 

mindestens einem Datenspeichersystem und/oder 
mindestens einem Computer system, das (die) 
lesend und/oder schreibend auf die Speicher- 

2 5 medien zugreift (zugreifen) , und/oder 

mindestens eine zwischen das (die) Computersy- 
stem(e) und das (die) Datenspeichersystem (e) 
geschaltete Kontroller-Einheit zur Steuerung 
des Verfahrens randomisierten Datenspeicherung 

3 0 umfasst. 



17. Anordnung nach Anspruch 16, 
dadurch gekennzeichnet, daE 
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das Datenspeichersystem 

Festplattenf elder und/oder 

als Web-Cashes ausgebildete Zwischenspeicher 
umfasst . 

5 

18. Anordnung nach einem der Ansprtiche 15 bis 17, 
dadurch gekennzeich.net, da£ 

die Anordnung mindestens eine zwischen das (die) 
Computer syst em (e) und das (die) Datenspeicher- 
10 system (e) geschaltete Kontroller-Einheit zur 

Steuerung des Verfahrens zur randomisierten Daten- 
speicherung umfasst. 

19. Anordnung nach Anspruch 18, 

15 dadurch gekennzeichnet , da£ 

die Anordnung mindestens ein tiber die Kontroller- 
Einheit auf die Speichermedien zugreifendes 
Computersystem umfasst. 

2 0 20. Anordnung nach einem der Ansprtiche 15 bis 19, 

dadurch gekennzeichnet, daiS 

das Verfahren zur randomisierten Datenspeicherung 
als Hardware -RAID- Verfahren in der Kontroller-Ein- 
heit implementiert ist. 

25 

21. Anordnung nach einem der Ansprtiche 15 bis 20, 

dadurch gekennzeichnet, da£ 

die Anordnung 

mindestens ein dediziertes, tiber Mittel zum 

3 0 Datenaustausch mit Speichermedien und Computer- 

systemen der Anordnung verbundenes Computer- 
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system (SAN-Appliance) zur Koordination der 
Datenspeicherung und/oder 

tiber Mittel zum Datenaustausch mit Speicher- 
medien und Computersystemen der Anordnung ver- 
5 bundene Rechenressourcen (In-Band-Appliances) 

zur Verteilung der Datenblocke 
umf as st . 

22. Anordnung nach einem der Anspriiche 15 bis 21, 
10 dadurch gekennzeich.net, da£ 

die Anordnung heterogene Speichermedien umf asst. 



23. Computerprograramprodukt , das ein computerlesbares 
Speichermedium umfaSt, auf dem ein Program ge- 

15 speichert ist, das es einem Computer ermoglicht, 

nachdem es in den Speicher des Computers geladen 
worden ist, ein Verfahren zur randomisierten 
Datenspeicherung in Speichernetzwerken und/oder 
einem Intranet und/oder dem Internet durchzu- 

2 0 fiihren, wobei die randomisierte Datenspeicherung 

die Verf ahrensschritte gemaiS einem der Anspriiche 1 
bis 14 umfafet. 



24. Computerlesbares Speichermedium, auf dem ein Pro- 
25 gramm gespeichert ist, das es einem Computer er- 

moglicht, nachdem es in den Speicher des Computers 
geladen worden ist, ein Verfahren zur randomi- 
sierten Datenspeicherung in Speichernetzwerken 
und/oder einem Intranet und/oder dem Internet 
3 0 durchzufiihren, wobei die randomisierte Datenspei- 

cherung die Verf ahrensschritte gemaE einem der 
Anspriiche 1 bis 14 umf aSt . 
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